Las redes sociales pueden resaltar las narrativas locales y revelar cómo la gente vive y reacciona ante una pandemia.
Explorando el papel de los lazos sociales en la reacción de una comunidad ante la pandemia de COVID-19 a través de Twitter
14 de Diciembre de 2021
Por Adriana Alvarado y Jorge Munguía
A medida que aparecían casos positivos de COVID-19 en la Ciudad de México[1] y los efectos de la pandemia se hacían visibles en múltiples dimensiones –más allá del desbordado sistema de salud–, los ciudadanos se acercaban unos a otros para entender, ayudar y reevaluar las expectativas de trabajo, educación, provisión de bienes, bienestar y cuidado.
Aunque las conexiones e intercambios entre individuos son difíciles de rastrear a través de datos estadísticos, son clave para entender cómo los lazos sociales y las iniciativas ciudadanas pueden apoyar mejor la respuesta de una comunidad a los efectos de la pandemia de la COVID-19. Pero ¿cómo podríamos saber más sobre estas iniciativas comunitarias, sus efectos y sobre dónde se estaban llevando a cabo? ¿A qué barreras y desafíos inesperados se enfrentaban? ¿Puede una sólida red de lazos sociales potenciar los efectos positivos de las iniciativas? Y si es así, ¿cómo?
Como indican las investigaciones, el capital social desempeña un papel importante en la reacción y la recuperación de las crisis, y por eso el Laboratorio de aceleración se preguntó cómo el capital social puede informarnos sobre la reacción inicial de Ciudad de México a la pandemia. Lee más sobre esto en nuestra entrada de blog anterior. Nuestro enfoque comenzó por identificar el capital social a nivel municipal y de vecindarios en cuatro dimensiones: unión, puente, articulación y desigualdad, utilizando los datos estadísticos disponibles. Paralelamente, mediante encuestas y entrevistas exploramos las iniciativas ciudadanas en reacción a la pandemia y sus experiencias durante los primeros meses.
Si bien estos enfoques eran directos, también tenían limitaciones. Para los indicadores de capital social, trabajamos con datos estadísticos disponibles que no eran todos recientes, construyendo aproximaciones tangenciales a nuestro tema. Además, a medida que se desarrollaba la crisis, no existían fuentes oficiales de datos que retrataran las necesidades y estrategias de los ciudadanos para afrontar e innovar los retos impuestos por la pandemia de la COVID-19. En relación con las iniciativas, el alcance de las encuestas se vio limitado por nuestra propia capacidad para identificar y conectar con un amplio abanico de iniciativas ciudadanas. Nos preguntamos si las conversaciones en las redes sociales podrían informarnos sobre cómo se relacionan las iniciativas entre sí, con las comunidades y con los programas gubernamentales. Comenzamos a analizar los datos de Twitter como una fuente alternativa de narrativas que podrían reflejar estrategias ciudadanas inusuales para abordar la crisis de la COVID-19. Los datos de las redes sociales han sido ampliamente utilizados en el pasado para entender, por ejemplo, la percepción de la gente sobre las crisis locales[2], las tendencias de las prácticas discriminatorias[3], la desinformación en línea[4], por mencionar algunos.
En la Ciudad de México, Twitter es un entorno rico para el examen de las prácticas sociales dentro de la esfera digital[5]. Según estadísticas recientes, hay once millones de usuarios de Twitter en México, lo que representa el 60% de los usuarios de Internet entre 16 y 64 años[6]. Además, Twitter permite la recopilación de datos. Específicamente, esperamos informar nuestra comprensión de la distribución geográfica de las iniciativas y conocer sus acciones.
Proceso | Lo que hicimos
Para orientar nuestra investigación en Twitter, primero analizamos las respuestas a una de las preguntas abiertas de nuestra encuesta, que requirió una descripción de las iniciativas ciudadanas. Las 147 respuestas ofrecieron amplios relatos de los objetivos de las iniciativas y de la población a la que iban dirigidas. A partir de este análisis, recopilamos una lista de hashtags, palabras clave y cuentas de redes sociales de personas y organizaciones que coordinaban las iniciativas. Esta información se organizó en función de las categorías del objetivo de las iniciativas. El cuadro 1 muestra los atributos que recogimos de las iniciativas centradas en la alimentación.
Category |
Hashtags |
Keywords |
Text Description |
Alimentos |
#ComidaParaHeroes, #mercadoSolidario, #ConsumeLocal, #CanastaVerde & Frutas |
Verduras, vales, despensa, comida, alimentos, hortaliza, mercado, restaurante, fonda, productor, agrícola, cocinar, gastronómico, agricultor, huacal, víveres. |
Caravana que acerca la venta de frutas y verduras a precio solidario a distintas colonias en Tláhuac. |
Tabla 1. Una muestra de hashtags, palabras clave y descripción de textos extraídos de las iniciativas recogidas a través de la encuesta.
Nuestro segundo paso fue recoger datos de Twitter. Utilizando la API de Twitter, recopilamos datos entre el 28 de febrero y el 17 de mayo de 2020, correspondientes a las fases epidemiológicas iniciales de COVID-19 en la Ciudad de México. Filtramos la búsqueda de tweets utilizando el nombre de las dieciséis alcaldías, o municipios, de la Ciudad de México en combinación con los hashtags y palabras clave recogidos en el análisis preliminar. En total, recogimos 300,361 tweets.
A continuación, se utilizó una herramienta de procesamiento del lenguaje natural (PLN) para el español con el fin de apoyar el análisis de los datos recogidos de Twitter, basándose en la incorporación de palabras mediante el algoritmo word2vec[7].
La entrada para nuestra herramienta fue un conjunto de tweets limpios de cada municipio y un conjunto de frases que describían una iniciativa. Los tweets limpios y las frases de la iniciativa se convirtieron en vectores utilizando word2vec con SBWCE. A continuación, se comprobó la similitud del coseno de cada vector de tuits con el vector de frases de cada iniciativa. En este contexto, una similitud del coseno cercana a uno indica que un tuit era semánticamente similar a la frase descriptiva de una iniciativa determinada. Utilizamos el PNL para reducir la sobrecarga de analizar manualmente esta relación.
Obtuvimos un único archivo de resultados por municipio con aproximadamente 1000 y 1500 tweets con contenido relacionado con las iniciativas. El uso del PNL nos ayudó a reducir el número de tweets que analizamos en las siguientes etapas. La siguiente etapa de análisis consistió en reducir aún más el número de tweets para el análisis cualitativo. Para ello, seleccionamos una muestra aleatoria de 100 tweets por municipio y, teniendo en cuenta las definiciones de unión, puente y vínculo, clasificamos cada tweet en un tipo de capital social. Después de la primera ronda de análisis, continuamos muestreando tweets en lotes de 100 hasta que alcanzamos la saturación de cada municipio, lo que significa que no se encontraron pruebas adicionales.
Figura 2. Tweets recogidos y seleccionados para su posterior análisis por alcaldía.
Al asociar los tweets, recogimos información adicional que utilizamos posteriormente para guiar nuestra interpretación. En la última etapa, utilizamos el análisis de contenido para identificar los puntos comunes, las distinciones y las relaciones entre las respuestas locales que los ciudadanos, los gobiernos y los esfuerzos de base coordinaron en cada municipio para hacer frente a la crisis del COVID-19. Nuestros temas emergentes reflejaron las diferentes manifestaciones de la vinculación y el establecimiento de puentes.
Hallazgos
La incorporación de Twitter a nuestra investigación reveló el potencial del análisis de datos de las redes sociales en el contexto de los proyectos de desarrollo como una valiosa plataforma para examinar el conocimiento situado que sería difícil de captar de otro modo. En Ciudad de México, la amplia adopción de Twitter entre las iniciativas lo convirtió en una poderosa fuente para identificar las respuestas cívicas que contribuyeron al proceso de recuperación de la ciudad.
Sin embargo, debido a la localidad y a la singularidad de algunas de estas respuestas, sólo pudimos registrar las iniciativas después de que se publicaran en la esfera pública de Twitter.
Tabla 2. Una muestra de tweets referidos a la iniciativa de los agricultores de Xochimilco.
A través de nuestro análisis de los datos de Twitter, también experimentamos limitaciones de precisión y representación.
- Exactitud: dado que los datos de las redes sociales no están estructurados y son difíciles de verificar, tuvimos que desarrollar mecanismos para garantizar la calidad y la fiabilidad de los datos. Por ejemplo, corroboramos la existencia de las iniciativas que encontramos buscando información adicional en línea.
- Representación dentro de los datos: los datos recogidos de cualquier plataforma de redes sociales siempre estarán sesgados debido a la muestra demográfica, limitando las perspectivas y necesidades de quiénes son visibles para el análisis.
Reconocemos que los datos de las plataformas de redes sociales están siempre incompletos y nunca serán exhaustivos de las experiencias de los ciudadanos y del gobierno al abordar una crisis. Sin embargo, proporcionaron pruebas de las respuestas colectivas, los activos de la comunidad y las particularidades de cada alcaldía que, de otro modo, habrían sido difíciles de identificar. Teniendo en cuenta las limitaciones y restricciones de los datos de Twitter, decidimos que el enfoque más adecuado para dar sentido a los datos recogidos era contribuir a una comprensión más holística de cada municipio.
Nuestro análisis final consistió en una visión cualitativa individual de cada municipio y una comparación de sus estrategias y prioridades. Caracterizamos cada municipio resumiendo las observaciones individuales sobre la articulación, la vinculación y las características del contexto. La caracterización de la vinculación consistió en una descripción de las estrategias del gobierno local a la hora de responder a las necesidades de la población, las poblaciones que eran prioritarias para cada municipio y la comunicación entre los ciudadanos y el gobierno. La vinculación consistió en los esfuerzos colectivos de las comunidades que se organizaron y aprovecharon sus recursos para hacer frente a las consecuencias sociales y económicas de la pandemia. Por último, las características del contexto consistían en describir los problemas locales arraigados en los municipios. Los datos de Twitter nos permitieron identificar a las personas, los activos locales, las narrativas, los ritmos y los modelos de organización que, de otro modo, habrían sido difíciles de encontrar. Esta exploración inicial puso de manifiesto la riqueza de enfoques y la pluralidad de formas de saber y hacer en tiempos de crisis.
Hacia nuevas aplicaciones
Nuestros resultados muestran que los datos de las redes sociales y otros rastros digitales son una fuente complementaria a los datos estadísticos y actúan como una ventana para entender las narrativas en la esfera pública. Sin embargo, queda por explorar cómo integrar fuentes de datos poco comunes en las prácticas más tradicionales del trabajo de desarrollo. A continuación, esbozamos una serie de recomendaciones que deberán explorarse en el futuro:
- Las pruebas obtenidas a partir de los contenidos generados por los usuarios deben considerarse un punto de partida para la investigación y no un desenlace: Para que los datos de las redes sociales se integren en las estadísticas oficiales, debemos desarrollar mecanismos que garanticen su exactitud. Un enfoque potencial podría ser complementar los hallazgos iniciales con métodos cualitativos como entrevistas estructuradas, conversaciones con actores relevantes y verificación sobre el terreno mediante visitas a las comunidades.
- La definición de las geografías y las poblaciones es fundamental para situar los datos de las redes sociales: Las esferas públicas en red como Twitter reflejan los temas que dominan el discurso local y global, lo que las convierte en una fuente ideal para captar las tendencias de la conversación pública. Sin embargo, hay que tener en cuenta dos aspectos principales:
- Representación: Como hemos mencionado antes, las perspectivas y las voces que captamos en las redes sociales son limitadas y no deben considerarse totalmente representativas de las comunidades que pretendemos comprender. En concreto, debemos tener en cuenta la relación con la tecnología y el acceso a Internet de nuestras comunidades objetivo. Dependiendo de la ubicación del estudio, puede haber limitaciones de representación en términos de geografía, grupo de edad o género, por nombrar algunos.
- Localidad: La escala y la granularidad de la segmentación de los grupos no siempre pueden captarse en las plataformas de las redes sociales. Por ejemplo, en nuestro estudio decidimos centrarnos en la recopilación de datos por municipios porque observamos que la gente tendía a utilizar hashtags con el nombre de su municipio en lugar de sus vecindarios. Es necesario comprender el vocabulario que la gente utiliza para referirse a su contexto; a partir de esa comprensión, determinamos cómo mapearlo para la comunidad que pretendemos examinar.
Las narrativas locales son esenciales para comprender los contextos y las perspectivas, y existen oportunidades para captarlas e integrarlas eficazmente en los proyectos de desarrollo. A medida que la tecnología se incorpora rápidamente a todas las interacciones sociales, los rastros digitales se han vuelto casi omnipresentes, revelando relatos, hábitos, patrones y cambios locales.
Con las herramientas y metodologías emergentes, el análisis de datos sociales en grandes cantidades -incluso en tiempo real y ante la incertidumbre- nos ayuda a entender un tiempo y un lugar a través de una multiplicidad de perspectivas y a identificar valores atípicos que podrían informar sobre estrategias situadas para aumentar nuestra probabilidad de éxito. No obstante, debemos seguir explorando cómo pueden desarrollarse estos enfoques. Si conoces más ejemplos de cómo explorar las formas en que las iniciativas se conectan con otras para ampliar su impacto, o ideas sobre la exploración de Twitter utilizada para proyectos de desarrollo, por favor, compártelas con nosotros en: acclabmx@undp.org
----------------------------------------
[1] En México, el primer caso confirmado ocurrió en la Ciudad de México durante la última semana de febrero, y la primera muerte por esta enfermedad en el país ocurrió el 18 de marzo de 2020.
[2] Pulso Mundial de las Naciones Unidas. (2013). Tweets indonesios para entender la crisis de los precios de los alimentos. https://www.unglobalpulse.org/project/mining-indonesian-tweets-to-understand-food-price-crises-2013/
[3] Pulso Mundial de las Naciones Unidas. (2014). Identificación de las tendencias de discriminación de las mujeres en el trabajo en las redes sociales. https://www.unglobalpulse.org/project/feasibility-study-identifying-trends-in-discrimination-against-women-in-the-workplace-in-social-media-2014/
[4] Pulso Mundial de las Naciones Unidas. (2020). Comprendiendo la pandemia de COVID-19 en tiempo real. https://www.unglobalpulse.org/project/understanding-the-covid-19-pandemic-in-real-time/
[5] Stewart, Bonnie. (2016). Twitter como método: El uso de Twitter como herramienta de investigación.
[6] Clay Alvino. 2021. Estadísticas de la situación digital de México en el 2020-2021. https://branch.com.co/marketingdigital/estadisticas-de-la-situacion-digital-de-mexico-en-el-2020-2021/
[7] Tomas Mikolov, Kai Chen, Greg Corrado, y Jeffrey Dean. 2013. Estimación eficiente de representaciones de palabras en el espacio vectorial. En actas del taller de la Conferencia Internacional sobre Representaciones de Aprendizaje (Scottsdale, Arizona, USA) (ICLR ’13).